建设针对科技创新活动的定量指标体系,是增强科技创新活动跨国家/跨组织可比性的基础,进而能够在决策中发挥评价(“量尺”)与引导(“指挥棒”)的双重作用。历史上,部分西方国家积累了设计科技创新定量指标体系的经验,在60年的时间维度上形成了一幅连续性演变图景,集中体现在从《弗拉斯卡蒂手册》(Frascati Manual)到《奥斯陆手册》(Oslo Manual)再到欧盟创新记分牌(European Innovation Scoreboard,简称“记分牌”)的演变之中。本文旨在总结这一演变过程背后的规律,并分析其对中国大学创新评价与定量指标体系设计的启示。
从《弗拉斯卡蒂手册》到《奥斯陆手册》:评价理念的演变
第二次世界大战后,世界各国逐渐意识到技术创新对于国家安全与发展的重要意义并普遍加大研发投入,但缺乏可用作跨国家比较的研究与试验发展(R&D)定义与归集/统计的准则。
针对这一问题,经济合作与发展组织(OECD)于1963年发布了首版R&D数据收集和报告指南性质的《弗拉斯卡蒂手册》并经过多次迭代。其核心逻辑是先定义R&D活动(符合新颖性、创造性、不确定性、系统性、可转移性/可复制性特征的活动),然后将用于这些活动的投入归集为R&D支出。
最新版《弗拉斯卡蒂手册》将“高等教育部门R&D”设为单独一章,详细说明了高等教育部门的范围、其R&D活动识别及特殊性(例如与教学活动之间的界限)、研发支出与人员的测度等。可以认为,目前中国大学通用的“项目-论文-专利”三元素定量评价体系背后的理念,就出自《弗拉斯卡蒂手册》。
相比于《弗拉斯卡蒂手册》,1992年开始发布的《奥斯陆手册》将自身定位为一个创新数据的收集、报告与使用指南,自初版起就明确了“研发≠创新”的理念,并将创新的范围进行了扩大化定义,纳入了非技术的创新类型。
具体来讲,《奥斯陆手册》有以下特点:一是将创新理解为一个“环境→投入→活动→产出→影响”的系统,而非将创新约等于R&D这一个环节;二是将因存在概念或测量模糊性而难以纳入R&D归集范围,却又对全面创新刻画十分重要的指标纳入评价体系;三是将除创新者自身之外的外部社会主体纳入指标体系,并分析这些外部主体与创新者在投入、活动与产出等环节的互动以及创新成果,对非直接相关外部社会主体的影响。
显然,《弗拉斯卡蒂手册》长于对R&D的精准识别,能够很好地服务于统计、会计和税务等部门的“计数”或“算账”需要。但如果混淆R&D与创新概念,以《弗拉斯卡蒂手册》理念设计来构建针对大学科技创新的定量评价体系,则天然带有窄化乃至矮化大学创新的倾向。
具体而言,第一,大学用于营造良好创新生态而做的努力(如建立以人才发展为目标的预聘长聘制度)会因无法建立与R&D活动的直接关系,而无法计入评价体系,反向导致论文、专利、项目指标在评价中占比过大,这是大学创新评价短期化倾向的理念根源之一。第二,大学创新以服务社会技术进步为追求,但这种从大学到社会的溢出效应无法计入评价体系(如面向产业需求的论文被专利引用现象在各种体系中都不算数),这是大学创新“闭门造车”倾向的理念根源之一。第三,大学创新活动(如科学家创办衍生企业)常跨越大学围墙内外,现有评价体系对此做生硬截断、只计入墙内部分,这又是大学创新之于科技全局贡献界定不清的一个理念根源。
前述倾向具有全球范围的普适性,在中国大学尤其明显。简而言之,我们需要明确《弗拉斯卡蒂手册》的本意是R&D归集,不应将其用于以“创新”为口径的数据收集与指标体系构建之中。
《奥斯陆手册》理念与欧盟创新记分牌
为推动区域创新发展、提升整体竞争力,欧盟于2000年制定里斯本战略,明确提出建成全球最具竞争力知识经济体的目标。为保障该战略有效落地,欧盟以《奥斯陆手册》核心理念为基础,创设记分牌这一工具。其核心目的在于全面和标准化地收集各国创新相关数据,开展国家间创新水平比较,最终对各成员国战略实施进度与成效进行监督。最新版记分牌(2025)的定量指标体系设计为“4大模块-12个维度-32个指标”的层级结构。笔者认为,基于《奥斯陆手册》理念设计的记分牌工具对于中国大学创新定量指标体系建设具有突出的借鉴价值。
记分牌在指标设置上延续了部分经典的R&D相关指标,体现出与传统做法之间的连贯性。例如,传统评价中核心的研发投入、学术论文数量、专利数量指标,分别被纳入投资模块下的企业投资维度、框架条件模块下的具有吸引力的研究体系维度,以及创新活动模块下的知识产权维度。此类传统指标虽得以保留,但在整个体系中的占比相对较低(约占四分之一)。关于记分牌指标体系的具体内容,分模块说明如下。
第一,框架条件模块。该模块聚焦支撑创新活动开展的基础环境建设,涵盖人力资源供给、科研体系效能、数字化基础设施保障等核心支撑要素,具体划分为人力资源、具有吸引力的研究体系与数字化三个维度。记分牌对框架条件的关注,反映出其设计的审慎性。若评价体系仅关注产出指标,就容易引导被评价对象忽视长期投资与能力积累,转而采取短期化策略以快速提升产出数据。而将环境构建和长期能力积累等框架条件与产出指标共同纳入评价,可相对平衡短期产出与长期发展之间的关系,缓解被评价对象的短期化倾向。此外,数字化维度的设置具有鲜明的时代性,该维度并非记分牌初始版本即有,是欧盟根据创新所嵌入基础环境的变化后增设的,体现出记分牌指标体系与时俱进的特点。
第二,投资模块。该模块主要关注创新活动开展所需的资源投入情况,包含资金与支持、企业投资两个维度。其中,资金与支持维度下的风险投资支出指标,集中体现了《奥斯陆手册》的宽口径理念。从功能定位来看,风险投资市场是初创型企业与新兴技术领域获取资金支持的主要渠道,但企业获得风投资金后并非专用于创新活动,也可能用于一般性的经营之中,由此在全面性与精准性之间形成了一个权衡关系:纳入该指标可更全面地反映企业创新资源的实际规模与来源构成,符合《奥斯陆手册》理念;但其固有的模糊性或不精确性导致难以被精确归集,与《弗拉斯卡蒂手册》的理念相冲突。换言之,是否选择此类指标本质上体现了定量指标体系在技术性(准确)与战略性(全面)上的取舍。
第三,创新活动模块。该模块聚焦创新实践的具体过程,包含中小企业创新、公私合作与知识产权三个维度,是《奥斯陆手册》关注全链条创新理念的集中体现。由于创新过程存在高度不确定性,部分符合创新规律的正确行为或决策,未必能产生预期的创新成果。基于此,增设针对创新行为特征(而非仅针对创新产出)的考核标准,可减轻那些开展了正确创新行为但未取得成效主体的评价压力。此类指标的纳入,本质上反映了记分牌不仅是为评价而评价,更是为促进各国更好响应里斯本战略目标而评价。例如,公私合作维度关注大学与企业间合作,其目的既在于促进企业技术创新吸收大学的科学研究成果,还在于促进分属不同国家的大学与企业加强沟通,加速欧洲的一体化进程。在实操中,公私合作出版物与PCT(Patent Cooperation Treaty)专利申请量两个指标有着相同的权重,说明记分牌兼重创新的过程与产出两个维度,以全面数据收集最终服务于宏观战略决策。
第四,影响模块。该模块关注创新活动产生的最终成效,且不局限于对创新主体自身的影响,具体划分为经济影响、社会影响与环境影响三个维度。该模块对社会影响与环境影响维度的关注,实质是对“何为高质量创新”问题的系统性回答——尽管欧洲对创新价值标准的界定未必符合其他国家的实际,但该评价思路为衡量创新活动的综合价值提供了重要参考。从具体指标设计来看,社会影响维度下的高技能岗位占比、终身学习参与率这两个指标与教育、科技、人才一体化发展的整体要求高度契合。此外,创新成果在欠发达地区普及率指标则体现了公平原则:若某项创新成果对创新主体而言具有较高经济价值,但在欠发达地区的推广应用存在障碍,按照记分牌评价规则,其得分将相应下调,以此引导创新活动兼顾经济价值与社会普惠性。
西方国家科技创新定量指标体系演变的启示
记分牌虽聚焦国家层面并侧重企业创新,但其核心思路仍有借鉴价值。在总体层面,中国大学科技创新定量评价体系应超越仅聚焦创新投入与产出的狭义视角,转向“框架→投入→活动→产出→影响”的全链条设计。在指标体系设计层面,可考虑更多引入有助于全面刻画大学创新活动但存在模糊性的指标,以此更完整地呈现中国大学的创新全貌。在数据收集层面,在传统的归集方法之外,应更充分地利用大数据与文本分析方法,从各类论文、专利、工商注册等数据库中直接挖掘并形成与大学创新相关的指标。
其一,在框架条件方面,营造支撑长期可持续创新的大学内部科研环境。
在大学创新情境下,框架条件模块应聚焦大学科学家创新活动所嵌入的组织环境与支持条件,以响应“十五五”规划中“投资于人”的核心理念,支撑大学长期可持续创新的基础。这一模块可考虑学术评价体系、内部资源分配机制与数字基础设施三个维度。
第一,构建以人为中心的学术评价体系。摒弃将科研人员视为论文生产工具、单纯服务于学科评估或“双一流”建设等的功利化导向,转而关注科研人员的长期成长与发展需求,通过科学制订人才引入启动支持与晋升考评标准,避免制度性压力迫使科研人员陷入短期化科研行为。
第二,设计公平包容的内部资源分配机制。重点向新实验室、青年科研团队等外部资源获取能力较弱的群体倾斜,同时对非共识性科学技术路径等给予宽容与支持,防止资源过度集中于少数主流领域与资深科研人员。
第三,建设普惠性数字基础设施作为支撑。顺应大科学与AI时代发展趋势,由学校层面统筹建设算力、存储设备等核心数字基础设施,组建专业技术支持团队;面向人文社科、基础学科等筹资能力较弱的领域,强化学生数字化技能培养,确保各学科均有机会利用好数字基础设施,为大学全领域创新提供坚实基础支撑。
其二,在创新投资方面,强化创新投入的可持续性与战略能动性。
大学创新投资模块的核心在于保障大学创新活动的资金供给数量/质量与学校层面的战略能动性,建议考虑关注科技财政可持续性、多元化科技经费筹措能力与校级可支配科技经费三个维度。
第一,科技财政可持续性。可聚焦国家自然科学基金、国家国防相关项目等传统科技财政路径的经费支持,既关注经费规模的充足性以保障科研活动长期开展,也关注年度之间科技财政经费的稳定性,避免因资金波动过大影响科研布局的连续性。
第二,多元化科技经费筹措能力。呼应《奥斯陆手册》重战略、宽口径的理念,将社会资本捐赠或大学科学家创业企业融资等情况纳入评价范畴。其中,后者情况下,相关资金虽未直接进入高校账户,但大量用于支付研究生实习薪酬、购置科研装备与耗材等核心科研支出,且相关科学成果仍以学校为作者单位发表,本质上是大学创新资源池的重要组成部分。由于这部分统计相对复杂,可以考虑一手问卷与二手数据库形式相结合进行收集。
第三,校级可支配科技经费。可核心关注归大学层级支配的科技资金的绝对数量与占比。这类资金区别于记在学校名下但由科研人员自主支配的经费,其占比越高,意味着学校越具备主动设计科技发展战略、布局重点领域与新兴方向的能力。
其三,在创新活动与产出方面,聚焦有组织科研、新科研范式应用与高质量成果。
评价创新活动的一个关键在于正视其高度不确定性特征,即正确的创新决策与实践未必能收获预期成果。因此,为防止评价导向过度偏向产出进而抑制科研人员探索未知的积极性,建议专门设立创新活动模块,对符合导向的创新活动予以认可。
对创新活动的讨论可关注两个维度:一是开展需求导向的有组织科研。针对传统机构(学院、研究所)因跨学科性不足而难以承接大科学项目与大产业项目的问题,突破“按学科划分机构”的固有模式,增加具备行政统筹能力的、跨学科的、实体性质的有组织科研机构在大学中的占比,以提升大学响应复杂技术创新需求的能力。二是对采用新科研范式的研究给予更多包容与鼓励。新科研范式在起步阶段往往容易面临争议,大学应建立容错机制,减少对使用非共识新范式进行的科学研究采用基于期刊级别的刚性考核;可考虑采用专家评议的方式,合理评估其在研究方法与科研范式层面的探索价值,为创新突破预留空间。
在科研产出评价方面,可考虑沿用学术论文与专利两大核心评价对象,兼顾数量与质量双重维度。在学术论文方面,数量维度涵盖论文发表的绝对数量、不同学科领域的人均论文数等;质量维度则包括国内外顶尖期刊(如中国科学院JCR期刊分区,尤其是一区)的论文占比、发表数量、高被引论文(如ESI高被引论文、ESI热点论文)数量、论文总被引频次、篇均被引频次、他引率等。在专利方面,数量维度包含专利申请量、授权专利总量、年度新增专利数等绝对指标;质量维度则聚焦PCT专利申请/授权量、专利被引频次、专利实施转化率、专利维持年限等指标。
其四,在创新影响方面,从产业、战略与全球维度拓展对创新价值的理解。
创新影响模块核心在于突破学术共同体单一评价视角,勾勒出中国大学科技创新在学术价值之外的实际应用价值与广泛影响力,全面回答社会(乃至国际社会)是否认可中国大学创新这一问题。该模块可分为中国大学创新的产业价值、战略价值以及全球价值三个维度,对应面向经济主战场、国家重大战略、人类命运共同体三个方面。
具体而言,大学创新的产业价值指的是基于科学论文被专利引用现象,讨论中国大学科学研究是否能够直接支撑产业技术创新,并进一步对引用中国大学论文的专利持有人的技术先进性与行业特征进行分析,以考察中国大学科学研究是否支撑了先进技术以及是否具有赋能型知识特征。同时,考察大学师生创业企业在风险投资市场上的融资规模与频次,以反映大学技术在进入产业化阶段后的被认可程度。其意义在于,应对社会观点普遍认为大学创新以基础研究为主业,而对大学能否在技术开发乃至产业化阶段仍发挥重要作用认知不足的现象。大学创新的战略价值指的是,以大学参与国家重点研发计划等的数量与实际贡献衡量其对国家重大战略的直接支撑,以及通过大学科技成果被全球范围内重大项目(含国际顶尖科技计划与他国国家级重点项目等)引用的情况来主要考察中国大学创新的战略价值。大学创新对“全球南方”国家的价值指的是,从兼顾“授人以鱼”与“授人以渔”两方面衡量中国大学创新的全球影响力。其中,“授人以鱼”体现为中国大学的科技成果被全球南方国家科技成果引用频次与占比,反映技术成果对发展中国家的实际赋能;“授人以渔”则聚焦全球南方国家学生来华就读博士研究生后的长期发展情况,特别是其中的归国人才在全球南方国家当地科技领域形成的同伴效应与辐射影响力,以考察中国大学创新对全球科技普惠与共同发展的贡献。
其五,在技术可行性方面,建设大数据技术、文本分析技术与公共数据库。
当前,我国高校科研数据的收集仍主要依赖“自下而上”归集的方式,这种方式的全部过程限于教育行政体系之内,具有行政约束力强、执行效率高的优势,但在指标可得性与精细度上存在显著短板。以衡量论文影响力这一目标为例:现有实践往往依靠统计“论文被引次数”加以实现,而无法区分其引用主体的性质(诺贝尔奖团队或不知名科学团队),更难以判断其引用意图(如作为发展理论的核心基础,或仅作为背景知识被提及),进而导致评价颗粒度粗糙,难以真实反映科研成果价值。近十年来,随着大数据技术与文本分析技术的迭代、算力硬件的升级以及高质量公共数据库的完善,构建基于公共数据的收集与分析方法已成为可能。换言之,我们已具备深度挖掘海量异质性数据、设计与国家战略意图高度匹配的精细化指标的技术基础。未来的中国大学技术创新定量指标体系应超越传统行政归集方式,探索行政归集与大数据挖掘相结合的混合模式,从而极大地丰富数据来源,提升指标体系的全面性、准确性与可行性。
我们再举两个具体例子详细说明:第一,在成果转化与产业化问题上,现有解决方案已经可以利用大语言模型进行跨库匹配,将工商注册信息中的企业创始人与大学教师名录进行关联,从而构建出大学教师校外创业的全景数据库。这不仅能揭示大学科技成果转化的路径偏好,还能通过追踪企业的市场表现来回答“大学技术是否有广泛的转化潜力”。第二,在人才流动与全球影响方面,结合行政记录与OpenAlex等新一代学术出版物数据库,已经可以清晰追溯全球范围内的人才流动轨迹,特别是能够精准识别来自全球南方国家的学生在中国获得博士学位后返回母国的科研表现及其产生的同伴效应。这些具体实践充分证明,新技术与新数据库的结合,已使构建更全面、更深入、更具战略导向的定量指标体系成为可能。(作者闵亦杰系北京大学中国教育财政科学研究所助理研究员,周奕多系北京大学中国教育财政科学研究所博士研究生)
来源:《神州学人》(2026年第6期)
工信部备案号:京ICP备05071141号
互联网新闻信息服务许可证 10120170024
中国教育报刊社主办 中国教育新闻网版权所有,未经书面授权禁止下载使用
Copyright@2000-2022 www.jyb.cn All Rights Reserved.